import pandas as pd

# 文件路径
file_path_dianxin = r'D:\xlzx\4G5G资料20220610\2024\电信站址存量表20240906.xlsx'

# 读取Excel文件
df_dianxin = pd.read_excel(file_path_dianxin)

# 将铁塔站址编码转为字符串类型
df_dianxin['铁塔站址编码'] = df_dianxin['铁塔站址编码'].fillna('').astype(str).str.strip()

# 删除铁塔站址编码为空或为nan的整行
df_dianxin = df_dianxin[df_dianxin['铁塔站址编码'] != '']

# 检查是否有空值
assert not df_dianxin['铁塔站址编码'].isnull().any(), "仍有空值存在"
assert not df_dianxin['铁塔站址编码'].eq('').any(), "仍有空白字符串存在"

# 找到重复的行
duplicates = df_dianxin[df_dianxin.duplicated(subset='铁塔站址编码', keep=False)]

# 保存重复的行到新的Excel文件
output_file_path = r'D:\xlzx\4G5G资料20220610\2024\电信站址存量表_重复20240906.xlsx'
duplicates.to_excel(output_file_path, index=False)

# 显示相关数据
print("重复的行已保存到:", output_file_path)